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摘 要 : 针对 高 分 六 号 WFV 数据 应 用 研究 基础 相对 薄弱 ,准噶尔 山楂 遥感 识别 在 算法 ,数据 源 等 方面 存在 不 足 的 
问题 ,联合 GF-6 WFV 和 ZY-3 号 影像 数据 提取 多 种 分 类 特征 ,基于 面向 对 象 分 割 ,特征 选择 .特征 重要 性 评价 与 组 
合 以 及 多 分 类 器 联合 等 方法 对 准噶尔 山楂 的 遥感 识别 开展 研究 ,提出 优选 特征 辅助 下 的 面向 对 象 多 分 类 需 组 合 的 


准噶尔 山楂 识别 算法 。 研 究 表明 :(1) GF-6 WFV 数据 能 够 很 好 的 对 准噶尔 山楂 进行 识别 ,特别 是 新 增 的 红 边 波段 


对 树种 识别 具有 重要 作用 ;(2) 面向 对 象 分 割 ,特征 选择 和 多 特征 组 合 都 对 准噶尔 山 棒 识 别 的 精度 具有 正 向 提升 作 


关键 词 ， 高 分 六 号 ; 特征 选择 ; 


准噶尔 山楂 (Crazaerus songarica ) 在 新 疆 霍 城 县 
果子 沟 大西 沟 .小 西 沟 以 及 伊 宁县 吉尔 格 朗 沟 等 
地 区 分 布 ,是 新 疆 特 有 珍稀 濒危 植物 ,被 列 人 国家 
优先 保护 物种 名 录 '"。 准 哆 尔 山 楂 具有 很 高 的 药 用 
和 营养 价值 ,对 于 干旱 区 生态 稳定 和 天 山野 果林 生 
物 多 样 性 保护 具有 重要 意义 。 气 候 变 化 和 人 为 干 
扰 的 加 剧 导 致 准噶尔 山楂 其 生境 遭 到 破坏 ,实际 面 
积 不 断 减 少 ”。 准 噶 尔 山楂 资源 的 保护 已 经 刻 不 容 
缓 ,准噶尔 山楂 空间 分 布 信息 的 准确 提取 人 研究 具有 
重要 意义 。 考 虑 到 天 山 脆弱 的 生态 系统 和 复杂 的 
地 形 环境 ,传统 森林 调查 方法 已 无 法 满足 应 用 要 
求 ,而 遥感 技术 凭借 准确 .快速 .生态 无 损 和 对 地 形 
敏感 度 低 的 特点 在 生态 脆弱 区 监测 领域 具有 天 然 
优势 和 巨大 潜力 。 

近 些 年 ,国内 外 众多 专家 对 遥感 树种 识别 技术 
开展 了 一 系列 的 研究 ,取得 了 丰硕 的 成 果 。 总 结 近 
10 a 的 研究 发 现 ,影像 识别 算法 经 历 了 从 传统 参数 
模型 (最 大 似 然 算法 、 迭 代 自 组 织 算法 和 K- 最 近邻 
算法 等 ) 到 非 参数 决策 算法 (支持 向 量 机 、 随 机 和 森林 
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]3(3) 多 分 类 器 组 合算 法 能 够 弥补 单一 分 类 器 表征 力 差 异 造成 的 误差 ,显著 提高 识别 精度 和 算法 的 稳定 性 。 
面向 对 象 ; 多 分 类 需 组 合 ; 准噶尔 山楂 


和 传统 人 工 神经 网 络 等 ) 再 到 数据 驱动 的 深度 学 习 
算法 和 基于 像 元 分 类 到 顾及 分 类 对 象 空间 分 布 特 
性 的 面向 对 象 分 类 的 过 程 ””。 随 着 航天 技术 的 发 
展 ,遥感 数据 获取 途径 更 加 多 样 .稳定 。 多 源 数 据 
融合 并 构建 能 够 多 角度 反映 森林 群落 属性 的 分 类 
特征 集 辅 助 识别 研究 成 为 主流 ,以 期 解决 森林 复杂 
群落 结构 下 “ 同 物 异 谱 ” 与 “ 同 谱 异 物 " 造 成 的 分 类 
难题 。 但 是 树种 识别 在 算法 研究 分 类 特征 构建 等 
方面 仍 存在 进一步 研究 的 空间 。 首 先 , 从 分 类 算法 
研究 角度 上 看 ,传统 单一 分 类 算法 易 受到 算法 原 
理 分 类 系统 等 因素 影响 ,难以 完整 有 效 的 对 目标 
进行 特征 化 的 表达 ,分 类 精度 表现 不 稳定 。 如 Kou- 
kal 等 "和 Yang 等 ”分 别 利 用 多 光谱 数据 和 激光 雷 
达 数 据 结合 随机 森林 算法 ,对 阿尔 卑 斯 山 附 近 的 和 森 
林 和 北方 森林 进行 分 类 识别 ,而 总 体 精度 一 个 高 达 
92%, 男 一 个 仅 有 66%。 而 能 够 依靠 数据 进行 特征 
自学 习 , 在 分 类 精度 上 表现 出 极 大 优势 的 深度 学 习 
算法 则 因 对 样本 集 和 运算 能 力 要 求 过 高 ,工程 化 应 
用 难度 很 大 ”"。 多 分 类 融融 合算 法 通过 分 类 权重 自 
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适应 或 组 合 投票 等 方式 ,能 够 在 一 定 程度 上 弥补 单 
一 分 类 器 特征 表征 能 力 不 足 造成 的 影响 ,提高 分 类 
的 精度 , 且 其 基本 单元 为 发 展 成 熟 的 传统 分 类 算 
法 ,易于 实现 ,是 目前 最 有 可 能 推动 树种 识别 产业 
化 应 用 的 识别 算法 ,具有 较 大 的 研究 价值 ”。 如 王 
怀 警 等 "使 用 多 分 类 右 组 合 策略 将 支持 向 量 机 和 
随机 森林 算法 进行 组 合 , 进 一 步 提高 了 森林 类 型 识 
别 的 精度 。 其 次 ,在 选择 数据 构建 分 类 特征 集 时 ， 
机 载 平台 数据 受到 越 来 越 多 的 关注 ,如 机 载 高 光谱 
数据 和 激光 雷达 数据 。 刘 怡 君 等 二 利用 机 载 高 光 
谱 数 据 与 激光 雷达 数据 融合 结合 支持 向 量 机 对 普 
洱 市 王 掌 山 试验 区 的 主要 树种 进行 分 类 ,取得 了 良 
好 的 效果 ; 刘 丽 娟 等 使 用 机 载 激光 雷达 和 CASI 高 
光谱 数据 结合 分 层 掩 腊 和 光谱 微分 技术 对 伊 春 市 
带 岭 区 凉水 国家 级 自然 保护 区 内 5 种 主要 树种 进行 
识别 ,总 体 精 度 高 达 83.88%。 虽 然 机 载 数据 在 很 多 
研究 中 表现 优异 ,但 是 数据 获取 成 本 较 高 ,应 用 难 
度 大 。2019 年 升 空 的 GF-6 号 卫星 携带 的 WFV 传 
感 涡 具有 高 时 间 分 辨 率 .多 波段 和 宽 覆 盖 的 特点 ， 
特别 是 相对 于 GF-1 WFV 传感器 新 增 了 红 边 、 黄 光 
和 紫光 波段 ,对 树种 识别 具有 重要 意义 ,但 是 其 相 
关 研 究 基 础 较为 薄弱 。 此 外 ,在 树种 识别 研究 对 象 
的 选择 方面 ,大 部 分 研究 都 集中 在 资源 储量 较 大 的 
树种 上 ,如 天 山 云 杉 、 马 尾 松 等 中 。 但 是 对 准 嘲 尔 
山楂 这 类 分 布 不 广 资源 储量 相对 较 小 ,但 对 当地 
生态 环境 保护 具有 重要 意义 的 群落 遥感 识别 研究 
极 少 。 近 年 来 ,对 准噶尔 山楂 的 研究 主要 集中 在 其 
理化 特性 、 群 落 特 征 和 保护 策略 上 ,如 李 利 平等 
通过 野外 调查 和 资料 收集 的 方式 获取 67 个 野 果林 
群落 样 方 ,分 析 了 新 疆 伊犁 地 区 野 果林 群落 结构 和 
分 布 特征 。 数 据 主要 通过 野外 调查 的 方式 获取 ,而 
对 应 用 成 本 更 低 .信息 获取 效率 更 高 的 遥感 提取 技 
术 研 究 较 少 。 

基于 上 述 遥 感 树 种 识别 研究 的 趋势 和 薄弱 点 ， 
本 文 以 准噶尔 山楂 作为 研究 对 象 ,基于 国产 ZY-3 
影像 .GF-6 WFV 影像 和 地 面 实 测 样本 数据 ,以 随机 
森林 和 支持 向 量 机 分 类 器 为 工具 ,开展 以 下 工作 : 
(1) 基于 线性 聚 类 算法 对 影像 进行 分 制 ,结合 实测 
数据 进行 评价 ,探究 准噶尔 山楂 识别 最 优 分 制 尺 
度 ;(2) 基于 影像 数据 提取 多 种 分 类 特征 因子 ,分析 
不 同 分 类 因子 对 准噶尔 山楂 提取 的 重要 度 ,构建 优 
选 分 类 特征 集 ;(3) 基于 随机 森林 (random forest, 


RF) 和 支持 向 量 机 (support vector machine, SVM ) 算 
法 构建 组 合 分 类 器 ,实现 准噶尔 山楂 分 布 信息 的 提 
取 , 以 期 弥补 单一 分 类 器 的 不 足 并 为 准噶尔 山楂 的 
保护 和 GF-6 WEV 数据 在 林业 上 的 应 用 提供 一 定 科 
学 的 参考 。 


1 研究 区 概况 


TE i Hee Ft FY Ae ML LR KR Ga BL OR FE 
山南 坡 选 取 长 宽 分 别 为 10.96 km Fil 10.21 km 的 矩形 
区 域 作为 研究 区 (80°45'00"E~80°52'30”E ,44°25'N~ 
44°30'N)( 图 1), 图 中 影像 由 ZY-3 多 光谱 数据 4、3、 
2 波段 假 彩色 合成 。 人 研究 区 位 于 第 四 季 冰 川 改造 而 
成 的 UD 型 谷 内 ,海拔 800~1500 m, 属 温带 湿润 性 气 
候 , 年 平均 温度 8.7 % ,平均 降水 266.9 mm ,无 霜 期 
165 d。 土 壤 多 为 沙壤土 和 草 旬 土 ,土质 松软 ,肥力 
适中 。 在 特殊 的 立地 因子 和 温和 湿润 气候 条 件 下 ， 
人 研究 区 内 植被 生长 茂密 ,乔木 高 3~4 m, 郁 闭 度 0.5~ 
0.7 ,形成 了 以 新 疆 准 噶 尔 山楂 为 主要 树种 的 植被 


2 数据 与 方法 
2.1 数据 来 源 与 处 理 


为 探究 多 特征 联合 识别 的 优势 ,融合 多 源 数 据 
提高 准 哆 尔 山 楂 识别 精度 ,本 次 人 研究 选择 成 像 时 间 
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图 1 研究 区 位 置 
Fig. 1 Location of study area 
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为 2019 年 8 月 的 GF-6 WFV 数据 和 同期 的 ZY-3 号 
全 色 及 多 光谱 数据 。 借 助 高 空间 分 辩 率 的 ZY-3 号 
数据 实现 超 像素 分 制 和 纹理 特征 提取 ,利用 光谱 通 
道 更 为 丰富 的 GF-6 WFV 数据 提取 光谱 和 植被 指数 
特征 。 遥 感 数据 具体 参数 如 表 1 所 示 。 


#21 GF-6 WFV 及 ZY-3 数据 参数 
Tab.1 GF-6 WFV and ZY-3 data parameters 
波长 空间 
分 辩 率 /m 
GF-6 WFV 2019-08-06 ” 蓝 波 有 段 0.45~0.52 16.0 
绿 波段 0.52~0.59 
红 波段 0.63~0.69 
近 红外 0.77~0.89 
红 边 波段 1 0.69~0.73 
红 边 波段 2 0.73~0.77 
紫 波段 0.40~0.45 
黄 波段 0.59~0.63 
ZY-3 2019-07-24 EWR ES 0.45~0.52 6.0 
绿 波段 0.52~0.59 
红 波段 0.63~0.69 
近 红 外 0.77~0.89 
全 色 波 段 0.50~0.80 2.1 


数据 类 型 ”成 像 时 间 波段 名 


江 围 /pm 


影像 预 处 理 主要 包含 以 下 部 分 ,首先 利用 中 国 
资源 卫星 应 用 中 心 提供 的 定 标 参 数 对 GF-6 和 ZY-3 
数据 进行 辐射 定 标 ,使 用 FLAAH 方 法 对 二 者 进行 大 
气 校正 ,结合 数字 高 程 模型 (digital elevation model, 
DEM) 和 几何 成 像 模型 参数 文件 (rational polynomial 
coefficient, RPC) 对 二 者 进行 几何 精准 校正 ,保证 均 
方 根 误差 控制 在 1 个 像 元 以 内 ,消除 地 形 对 影像 的 
影响 ,实现 二 者 的 空间 配 准 。 然 后 使 用 G-S 算 法 
(Gram-Schmidt Spectral Sharpening) 将 ZY-3 号 全 色 
和 多 光谱 数据 进行 融合 ,并 使 用 主 成 分 分 析 方 法 
(principal component analysis, PCA ) 对 融合 后 ZY-3 
数据 进行 信息 压缩 ,将 可 用 信息 集中 到 第 一 主 成 分 
中 ,用 于 后 续 纹 理 特征 提取 及 图 像 分 割 。 

2.2 样本 集 的 构建 与 划分 

为 合理 构建 训练 与 验证 样本 集 ,保证 分 类 器 构 
建 的 精度 和 后 续 精 度 验 证 的 可 靠 性 ,将 一 类 森林 清 
查 数据 和 野外 调查 数据 作为 辅助 数据 参与 样本 构 

建 。 其 中 一 类 清查 数据 为 霍 城 县 林业 部 门 在 2013 
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录 小 班 内 的 主要 树种 ,相对 于 遥感 影像 而 言 ,尺度 
较 大 ,而 野外 调查 点 数量 有 限 , 仅 依靠 野外 调查 点 
构建 样本 ,在 训练 时 会 因 样本 不 足 导致 过 拟 合 。 为 
了 保证 样本 分 布 均匀 上 且 具有 足够 代表 性 ,将 研究 区 
均匀 划分 为 3025 个 长 宽 为 182 mx170 m 的 规格 矩 
形 区 域 。 参 照 外 业 调查 数据 和 林业 局 提供 的 森林 
资源 清查 数据 ,结合 面向 对 象 分 割 结果 TERS 
分 析 。 在 每 个 矩形 区 域内 尽 可 能 的 选择 出 一 个 面 
积 不 小 于 900 m2, 同时 地 类 足够 单一 的 样本 点 。 考 
虑 到 可 及 性 和 样本 设置 的 科学 性 ,最 终 选择 出 样本 
2517 个 ,其 中 ,准噶尔 山楂 样本 1029 个 .草地 样本 
638 A . 裸 地 样本 691 个 和 其 他 林地 样本 159 个 。 按 
照 等 比 随机 分 割 的 方式 ,将 各 类 样本 划分 为 5 份 ,其 
中 3 份 用 于 分 类 器 的 训练 ,1 份 用 于 特征 优选 和 分 类 
器 参数 选择 时 的 交叉 验证 ,1 份 用 于 最 后 分 类 结 
的 精度 验证 。 


3 试验 方法 


3.1 面向 对 象 多 尺度 分 割 

传统 的 基于 像 元 进行 影像 信息 提取 ,运行 效率 
较 低 且 易 产生 "椒盐 现象 " 同时 ,在 不 同 尺 度 的 分 
类 特征 进行 融合 时 , 像 元 级 的 融合 需要 对 数据 进行 
重 采 样 ,统一 像 元 尺度 ,这 就 不 可 避免 的 造成 信息 
的 丢失 或 者 是 运算 力 的 浪费 。 为 有 效 的 解决 上 述 
问题 ,本 文采 取 面 向 对 象 多 尺度 分 割 的 方式 ,通过 
试 错 法 选择 最 优 尺度 进行 分 割 , 在 对 象 层面 上 实现 
分 类 特征 融合 和 准噶尔 山楂 识别 。 

线性 谱 聚 类 算法 (linear spectral clustering, LSC ) 
是 基于 归 一 化 切割 (normalized cut, NC ) 改 进 的 新 型 
分 割 算法 。 该 方法 使 用 内 核 相 似 度 来 度量 函数 ,在 
像素 高 维特 征 空间 内 ,通过 加 权 K-means 度 量 目标 
函数 ,达到 归 一 化 分 割 的 目的 汪 。LSC 能够 有 效 避 
免 相 关联 矩阵 的 分 解 ,具有 较 高 的 内 存 效率 和 较 低 
的 运算 复杂 性 。 其 中 加 权 K-means 度 量 定义 如 下 : 


从， 二 之 Zeolem-a (1) 


式 中 : w(p) 为 像 元 p 在 高 维 空间 中 的 权重 ; d, 为 聚 
类 中 心 点 ; op) 为 颜色 和 空间 坐标 构成 的 空间 多 维 


年 第 八 次 森林 资源 清查 数据 的 基础 上 逐年 更 新 获 
得 ,野外 调查 数据 于 2019 Æ 8—9 月 野外 调查 获 
得 。 考 虑 到 一 类 森林 清查 数据 是 以 小 班 为 单位 , 记 


向 量 空间 特征 ;K-m 是 K-mean 的 缩写 尖 为 聚 类 中 心 
序号 ;天 为 聚 类 中 心 总 数 。 
考虑 到 林地 结构 复杂 .边界 不 清晰 等 特点 ,本 
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文 以 一 类 清查 数据 和 实地 调查 数据 为 参考 ,利用 试 
错 法 确定 最 佳 分 割 尺度 。 为 了 保证 分 割 对 象 内 具 
有 足够 的 纯净 度 , 采 用 过 分 割 策略 , 即 在 分 割 对 象 
内 部 无 明显 混合 地 类 后 ,再 将 分 割 尺 度 调 小 5。 最 
终 确 定 分 割 尺 度 为 50, 形 状 因子 为 0.6, 紧 致 度 为 
0.3。 如 图 2 所 示 , 通 过 试 错 法 和 过 分 割 方式 得 到 的 
分 割 对 象 能 够 有 效 的 对 不 同 地 物 进行 区 分 。 
3.2 多 分 类 特征 提取 

为 充分 融合 不 同 传感器 数据 的 优势 特征 ,利用 
GF-6 WFV 数据 提取 光谱 特征 与 植被 指数 特征 , 利 
用 经 过 融合 和 主 成 分 分 析 后 的 ZY-3 号 数据 进行 纹 
理 特征 提取 , 共 提 取 分 类 特征 71 个 。 在 面向 对 象 分 
割 的 基础 上 提取 光谱 特征 包括 GF-6 WFV 号 数据 8 
个 波段 的 亮度 值 (Brightness, BN) 对象 特 征 最 大 像 
元 值 (maximum pixel value, MAX) 、 最 小 像 元 值 (min- 
imum pixel value, MIN) 和 像 元 偏 度 (skewness, 
SKE)。 利 用 波段 计算 工具 和 GF-6 WFV 数 据 提取 7 
种 植被 指数 特征 : 归 一 化 植被 指数 (normalized dif- 
ference vegetation index, NDVI) .比值 植被 指数 (ratio 
vegetation index, RVI) 、 差 值 植被 指数 (difference veg- 
etation index, DVI) ` 红 边 指数 (vogelmann red edge in- 
dex, VRE) .光化学 植被 指数 (photochemical reflec- 
tance index, PRI) 和 两 种 花 青 素 反 射 指数 (anthocyan- 
in reflectance index, ARI)。 使 用 灰 度 共生 矩阵 (gray- 
level co-occurrence matrix, GLCM ) ) 和 PCA 后 的 ZY-3 
数据 提取 4 个 方向 的 8 种 纹理 特征 Mi Centropy, 
ENT) .均值 Cmean, MEA) 方差 (variance, VAR) 、 对 
比 度 (contrast, CON) | 143 PE (homogeneity, HOM) 、 
角 二 阶 矩 (second Moment, ASM) 相关 性 (correla- 
tion, COR) FIFE PE (dissimilarity, DIS)。 研 究 共 提 
取 32 种 光谱 特征 ,7 种 植被 指数 特征 和 32 种 纹理 特 
征 ,为 消除 特征 量 级 对 评价 和 分 类 结果 的 影响 HK 


用 最 大 最 小 值 归 一 化 的 方式 对 各 类 特征 进行 归 一 
化 处 理 。 另 外 ,需要 说 明 的 是 经 过 试 错 法 发 现 纹理 
特征 提取 窗口 大 小 为 7x7 时 ,能 够 有 效 避 免 林 分 冠 
层 和 阴影 的 影响 ,提高 准噶尔 山楂 识别 精度 , 故 将 
纹理 提取 窗口 设置 为 7x7。 各 植被 指数 特征 计算 公 
式 及 表征 含义 如 表 2 所 示 。 

3.3 分 类 特征 优选 与 评价 

为 了 降低 特征 间 的 相关 性 ,减少 匈 余 ,使 用 特 
征 递归 消除 法 (recursive feature elimination, RFE ) 进 
行 特征 集 的 优选 ,并 基于 随机 森林 模型 ,通过 平均 
纯度 减少 (mean decrease impurity, MDI) 对 特征 的 重 
要 性 进行 排序 和 分 析 。 

RFE 作为 一 种 用 于 特征 优选 的 算法 ,该 算法 可 
以 通过 迭代 的 移 除 特征 变量 和 循环 反复 的 建 模 达 
到 剔除 贡献 较 低 的 特征 ,达到 筛选 最 佳 分 类 特征 的 
目的 。 本 文 利用 scikit-learn AREER GETAFE TAR 
和 交叉 验证 (图 3)。 由 图 3 可 以 看 出 ,总 体 上 通过 
RFE 筛选 的 特征 数量 与 分 类 总 体 精 度 具 有 较 强 的 
相关 性 。 最 初 , 随 着 参与 分 类 的 特征 数量 增加 ,分 
类 精度 呈现 出 正 向 响应 ,分 类 总 体 精度 不 断 升 高 ; 
特征 数量 达到 15 个 时 ,总 体 精度 提升 速度 达到 最 
大 ,增加 速度 开始 减缓 ;最 后 , 当 参 与 分 类 特征 数量 
达到 21 个 时 ,分 类 总 体 精度 达到 最 大 值 96.8% , 总 
体 精 度 不 再 提升 ,并 开始 出 现 震 荡 。 据 此 ,本 文 将 
利用 这 21 个 特征 因子 构建 最 优 特征 集 。 

为 了 更 好 的 探究 特征 因子 对 准噶尔 山楂 识别 
结果 的 影响 ,基于 RF 模型 利用 MDI 对 优选 特征 的 
重要 性 进行 评价 ,该 值 越 大 特征 越 重 要 。 特 征 重要 
性 评价 结果 如 图 4 所 示 , 其 中 光谱 特征 来 自 GF-6 
WFV 的 8 个 波段 ,其 后 级 表示 提取 该 特征 的 波段 ， 
如 BN_x 表 示 波 段 x 的 亮度 值 。 纹 理 特征 来 自 融 合 、 
降 维 后 的 ZY-3 数 据 , 其 后 缀 代表 纹理 特征 提取 的 
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图 2 面向 对 象 分 割 结果 (局 部 ) 


Fig. 2 Object-oriented segmentation results(local) 
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表 2 植被 指数 概览 


Tab. 2 Table of vegetation index 


植被 指数 计算 公式 表征 意义 及 取 值 范围 
NDVI (xn —Pren)/(Prm + Pron) ”表征 植被 绿地 ,植被 茂密 时 其 灵敏 度 会 降低 ; 取 值 范围 -1~1 ,一 般 植被 范围 是 0.2~0.8 
RVI Pan/ Prev 大 气 敏 感 ,在 植被 茂密 时 分 辨 力 更 强 ; 取 值 范围 0~30+ ,一 般 植被 范围 2~8 
DVI Pan ~ Prev ERUR , ZEROED BREN , Ze TIE 7 EIR ; PURE Fl at BQ 9 BE 
VRE Prao/ Pro 对 叶绿素 浓度 . 叶 冠 层 和 水 分 含量 的 综合 灵敏 ; 取 值 范围 0~20, 一 般 植被 范围 4~8 
PRI (Psi = Ps) / (Oss + Ps7) 对 活 林木 的 类 胡 葛 卜 素 变化 反应 灵敏 ; 取 值 范围 -1~1 ,一 般 植 被 区 范围 -0.2~0.2 
ARII 1/psso — UP 对 叶片 中 的 花 青 素 非 常 敏感 ; 取 值 范围 0~0.2+ ,一般 植被 范围 0.001~0.1 
ARI2 Paw X (1/psso = LP) ARI2 是 ARII 的 改进 ,在 高 花 青 素 浓度 时 更 加 有 效 ; 取 值 范围 0~0.2+, 一 般 植 被 范围 0.001~0.1 


TE: p, 代 表 波 长 x 处 植被 的 反射 率 。 


总 体 精 度 /% 
a 


1 5 9 13172125 29 33 37 41 45 49 53 57 61 65 69 
特征 数量 /个 
图 3 分 类 精度 与 特征 优选 关系 
Fig. 3 Relationship between classification accuracy and 


feature optimization 


图 4 优选 特征 重要 性 评价 


Fig. 4 Importance evaluation of preferred features 


角度 ,如 ASM_y 表 示 y 角 度 方向 上 的 角 二 阶 窍 。 可 
以 看 出 :通过 特征 优选 的 21 个 分 类 特征 中 ,光谱 特 
征 有 10 个 ,重要 性 从 低 到 高 排序 为 :BN_3、SKE_6、 
BN_5.BN_4.BN 2.SKE_3.BN_1.BN_6.MAX 5 和 
MIN_4; 植 被 指数 特征 5 个 ,分 别 是 NDVI、DVI、RVI、 
ARI2 和 PRI; 纹 理 特征 6 个 , 按 重 要 性 排序 为 :MEA_ 
0、ASM_45、ENT_0、COR_0、HOM_90 和 DIS_0。 在 
光谱 特征 中 ,第 3、4、5、6 波 段 所 提取 的 特征 因子 对 


于 树种 识别 更 加 重要 ,而 在 纹理 特征 中 ,0° 方 向 上 提 
取 的 各 类 特征 表现 更 加 优越 。 植 被 指数 特征 在 分 
类 中 尤为 重要 ,本 文 提 取 的 7 种 植被 指数 特征 ,5 种 
进入 优选 特征 集 , NDVI 更 是 各 类 特征 中 最 为 重要 
的 分 类 特征 。 
3.4 分 类 器 及 分 类 方案 构建 

针对 单一 分 类 器 在 不 同 场景 下 表现 能 力 差异 
化 的 问题 ,使 用 被 大 量 人 研究 证 明 识 别 性 能 良好 且 稳 
定 的 SVM 和 RF 分 类 器 进行 准噶尔 山楂 的 识别 ,并 
基于 二 者 构建 权重 自 适 应 的 组 合 投票 分 类 器 
(weighted adaptive voting combination classifier, 
WAVCC). SVM 的 学 习 策 略 就 是 间隔 最 大 化 ,可 形 
式 化 为 一 个 求解 凸 二 次 规划 的 问题 ,在 解决 小 样 
本 非 线 性 及 高 维 模 式 识别 中 表现 出 良好 的 性 能 。 
本 文 SVM 核 函数 为 径 向 基 核 函数 。RF 以 决策 树 为 
基础 分 类 器 进行 集成 , 比 单个 决策 树 更 加 稳定 , 泛 
化 性 能 更 好 。RF 的 随机 特性 使 得 其 具有 优秀 的 降 
噪 能 力 ,不 易 陷 人 过 拟 合 ,几乎 不 需要 人 工 干 预 , 且 
基于 对 比 计算 进行 树种 分 类 使 得 算法 运算 效率 相 
对 较 高 。 基 于 最 优 特征 集 和 网 络 搜索 验证 对 SVM 
和 RF 模型 的 参数 进行 优化 ,最 后 确定 SVM 模 型 样 

影响 半径 倒数 gamma=0.005 ,惩罚 因子 C=1500, 

RF 模型 特征 数 m 设 置 为 3, 决 策 树 数量 N=400。 

对 SVM 和 RF 模型 的 分 类 结果 进行 精度 验证 ， 
将 用 户 精 度 和 制图 精度 的 均值 作为 算法 对 地 物 的 
识别 精度 ,该 精度 作为 该 算法 对 此 类 地 物 识别 权 
重 。 算 法 对 地 物 识别 归属 拥有 1 乘 以 该 方法 对 这 一 
地 物 识 别 权重 分 的 投票 权 ,结合 SVM 和 REF 识别 算 
法 结果 并 行 的 方式 对 研究 区 树种 分 布 进行 组 合 投 
票 以 确定 研究 区 树种 识别 最 后 结果 。 组 合 方法 和 
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投票 组 合 规 则 公式 如 下 : 

«X= [rts G,), e,(x) =jHyeA 
0, 其 他 
| j T (Xec) maT (XEC) (3) 
M+1, 其 他 
式 (2) 和 式 (3) 分 别 为 投票 组 合 方法 和 改进 后 
投票 组 合 规则 ,对 于 输入 的 X 分 类 ,分 类 避 e, 输出 
的 投票 分 数 为 P, , 即 用 户 精度 与 制图 精度 的 平均 
B C 表示 影像 内 是 j 的 对 象 ; ru(Xe C) 表示 类 别 
C, 经 过 分 类 器 C, 输出 后 得 到 的 分 数 ; MR 
BL, M+ 1 ANAK AEA 


(2) 


为 了 更 好 的 评价 面向 对 象 分 割 方法 .特征 优选 
和 权重 自 适应 的 多 分 类 器 组 合算 法 对 分 类 结果 的 
影响 ,同时 探究 不 同 特征 因子 与 准噶尔 山楂 识别 精 
度 之 间 的 响应 关系 ,按照 控制 变量 的 方式 设置 了 7 
种 分 类 方案 ( 表 3)。 通 过 对 比方 案 1 和 方案 2 的 识 
别 结 果 ,分 析 特 征 优 化 对 准噶尔 山楂 识别 的 影响 。 
比较 方案 1 和 方案 3 的 识别 精度 ,研究 对 象 尺度 与 
像 元 尺度 准噶尔 山楂 识别 的 差异 。 通 过 方案 1 N 
案 4 和 方案 5 的 对 比 , 验 证 权重 自 适应 的 多 分 类 器 
组 合算 法 的 性 能 。 对 比方 案 1 方案 6 和 方案 7 准 踢 
尔 山 楂 识别 的 精度 ,探究 不 同 特征 因子 对 识别 精度 
的 影响 。 


表 3 分 类 方案 
Tab. 3 Classification schemes 
分 类 方案 分 类 特征 因子 分 类 算法 是 否 分 割 

方案 1 天 化 全 部 特征 (21) WAVCC 是 

方案 2 未 优选 全 部 特征 (71) WAVCC 是 

方案 3 天 化 后 像 元 尺度 特征 (17) WAVCC 否 

方案 4 优化 后 全 部 特征 (21 ) SVM 是 

方案 5 优化 后 全 部 特征 (21) RF 是 

方案 6 优化 光谱 特征 + 优化 纹理 特征 (16) WAVCC 是 

TRI 优化 光谱 特征 + 优化 植被 指数 特征 (15) WAVCC 是 

表 4 分 类 方案 评价 
4 结果 与 分 析 Tab. 4 Evaluation of classification schemes 
分 类 方案  OA/% Kappa UA/% PA/% ET/min 

基于 上 述 7 种 分 类 方案 和 预 留 的 验证 样本 集 ， ÆI 0527. 092 98 9472 170 
利用 混淆 和 矩阵 计算 各 分 类 方案 制图 精度 (producer 方案 2 9529 O71 9033 9451 388 
accuracy, PA) .用户 精度 (user accuracy, UA)、 总 体 方案 3 92.43 0.88 89.41 86.99 30.4 
精度 (overall accuracy, OA ) 和 Kappa 系数 4 个 精度 衡 方案 4 93.46 0.76 92.72 89.96 9.4 
量 指标 对 分 类 结果 进行 评判 。 方案 5 91.96 0.81 88.86 91.21 5.7 
方案 6 87.34 0.91 87.33 87.10 12.9 
4.1 特征 优化 和 组 合 对 识别 的 影响 方案 7 90.59 0.83 91.22 89.57 11.3 


在 识别 算法 和 计算 器 硬件 保持 一 致 的 前 提 下 ， 
根据 各 方案 对 准噶尔 山楂 进行 识别 和 精度 验证 , 同 
时 记录 分 类 耗 时 (elapsed time, ET)( 表 4) ,其 中 UA 
和 了 PA 均 是 指 准 踢 尔 山楂 精度 ,OA 和 Kappa 系 数 则 
是 指 整个 分 类 系统 的 精度 。 对 比方 案 1 和 方案 2 可 
以 看 出 :使 用 优化 后 特征 集 的 方案 2 相 较 于 方案 1 
BIRTE OA 上 略 低 0.02% ,但 是 具体 到 准噶尔 山楂 的 
识别 上 ,方案 1 的 UA 和 OA 都 要 显著 高 于 方案 2。 
另外 ,方案 1 的 Kappa 系 数 显 车 高 于 方案 2, 说 明 方 
案 1 的 随机 性 更 低 , 性 能 更 加 稳定 。 在 运算 时 间 上 ， 
未 通过 特征 选择 的 方案 2 的 运算 耗 时 是 方案 1 的 


2.28 信 。 通 过 RFE 进行 特征 选择 可 以 在 保证 识别 
精度 的 前 提 下 ,有 效 的 降低 运算 量 ,提升 分 类 器 的 

对 比方 案 1 方案 6 和 方案 7, 探 究 不 同 特征 组 
合 与 识别 精度 之 间 的 响应 关系 。 可 以 看 出 :光谱 、 
纹理 和 植被 指数 特征 联合 进行 分 类 取得 最 高 的 识 
别 精 度 ,多 特征 的 联合 能 够 有 效 的 提高 准噶尔 山楂 
识别 的 准确 率 , 但 是 随 着 参与 分 类 的 特征 因子 变 
多 ,算法 耗 时 也 会 相应 增加 。 方 案 7 除 Kappa 系数 
略 低 于 方案 6, 在 其 他 各 个 衡量 指标 上 相 较 于 方案 6 
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都 具有 优势 ,这 说 明 纹理 特征 和 植被 指数 特征 都 能 
有 效 提高 准噶尔 山楂 的 识别 精度 , 且 植 被 指数 特征 
对 准噶尔 山楂 识别 精度 提升 的 贡献 要 大 于 纹理 
特征 。 
4.2 面向 对 象 分 割 对 识别 的 影响 

通过 对 比方 案 1 和 方案 3 的 识别 精度 和 运算 耗 
时 ,对 基于 像 元 和 基于 对 象 2 种 分 类 方法 在 准噶尔 
山楂 识别 上 性 能 的 差异 进行 评价 。 在 这 里 需要 说 
明 的 是 ,因为 MAX MIN 和 SKE 三 类 光谱 特征 只 存 
在 于 对 象 尺度 ,在 像 元 层次 不 存在 这 三 类 特征 ,所 
以 方案 3 中 参与 分 类 的 特征 因子 相 较 于 方案 1 少 了 


80°46'0"E 80°48'0"E 80°50'0"E 80°52'0"E 


44°28'0"N 


44°26'0"N 


< ) r Te 了/ 
80°48'0"E 80°50'0"E 80°52'0"E 
0 2km a ENR LL 
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4 个 ,另外 ,此 处 的 运算 耗 时 仅 指 依靠 WAVCC 算 法 
进行 分 类 所 需 的 识别 ,不 包括 基于 像 元 分 类 前 期 需 
要 做 的 重 采 样 和 融合 等 操作 ( 表 4 和 图 5)。 从 结果 
可 以 看 出 : 相 较 于 方案 1, 基 于 像 元 的 识别 方案 出 现 
明显 的 “椒盐 现象 " ,识别 结果 出 现 十 分 破碎 的 像 元 
块 ,整体 性 较 差 ,导致 其 各 类 精度 衡量 指标 都 显著 
低 于 基于 对 象 分 类 。 同 时 ,因为 WAVCC 分 类 算法 
需要 在 单一 分 类 器 识别 的 基础 上 逐一 单元 的 进行 
投票 判定 ,同一 区 域 数据 像 元 数量 远 高 于 分 割 对 象 
数量 ,导致 基于 像 元 的 WAVCC 算 法 在 耗 时 上 也 明 
显 高 于 基于 对 象 的 算法 。 
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图 5 不 同 层次 分 类 对 比 


Fig. 5 Importance evaluation of preferred features 


43 多 分 类 算法 联合 对 识别 的 影响 

单一 分 类 带 在 进行 识别 分 类 时 , 因 分 类 算法 机 
理 和 性 能 的 差异 ,对 不 同 分 类 对 象 表征 能 力 不 同 ， 
难免 会 造成 一 定 的 误差 。 为 了 尽 可 能 的 避免 上 述 
问题 的 出 现 ,提高 准噶尔 山楂 识别 精度 ,本 文 基于 
自 适应 权重 投票 将 RF 和 SVM 算 法 进行 组 合 得 到 了 
WAVCC 分 类 算法 。 如 表 4 和 图 6 所 示 , 对 比方 案 1、 
方案 4 和 方案 5 可 以 看 出 ,联合 RF 和 SVM 算 法 的 
WAVCC 分 类 算法 在 各 项 精度 评价 指标 上 都 要 显著 
优 于 单一 分 类 器 算法 ,这 表明 该 分 类 器 能 够 很 好 的 
集成 RF 和 SVM 分 类 器 的 优点 ,抵消 一 部 分 单一 分 
类 器 表征 能 力 不 足 带 来 的 误差 ,提高 分 类 算法 的 精 
度 和 稳定 性 。 当 然 ,因为 WAVCC 识别 结果 是 在 RF 
和 SVM 识别 和 精度 验证 的 基础 上 ,按照 投票 权重 对 
分 类 单元 逐一 计算 权重 得 来 的 ,所 以 在 运算 耗 时 上 
要 高 于 单一 分 类 器 耗 时 。 
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Fig.6 Accuracy comparison of different 
classification algorithms 
5 结论 


本 文 利用 面向 对 象 分 割 、 多 源 特征 提取 、 特 征 
递归 消减 和 分 类 器 组 合 等 方法 对 多 特征 因子 辅助 
的 GF-6 WFV 数据 准噶尔 山楂 识别 问题 开展 一 系列 
研究 ,探究 分 类 尺度 、 特 征 选择 \ 特 征 组 合 和 分 类 算 
法 等 因素 对 准噶尔 山楂 识别 影响 ,得 到 以 下 结论 : 


202104.00100v1 


chinaXiv 


560 干 F 


pai 


= 
a 


ChinaXiv 合 作 期 刊 


38 卷 


(1) 利用 GF-6 WFV 数据 能 够 很 好 的 识别 准 嘲 
尔 山 楂 ,GF-6 WFV 数据 在 林业 生产 中 具有 很 大 的 
应 用 潜力 。 在 GF-6 WFV 影像 参与 的 各 分 类 方案 
中 ,无 论 是 何 种 分 类 算法 和 特征 组 合 , 是 否 进行 面 
向 对 象 分 制 和 特征 优选 ,识别 结果 的 OA 均 大 于 
87% ,Kappa 系 数 优 于 0.7, 证 明 GF-6 WFV 数据 可 以 
用 于 准噶尔 山楂 空间 分 布 信息 提取 , 且 具 有 一 完 
优势 。 

(2) GF-6 WFV 相 较 于 GF-1 WFV 新 增 的 2 个 
红 边 波段 对 准噶尔 山楂 的 识别 具有 重要 作用 。 特 
征 优选 能 够 有 效 降 低 分 类 特征 间 的 宛 余 ,提高 运算 
效率 和 算法 的 稳定 性 。 选 择 后 的 特征 对 准噶尔 山 
楂 识别 的 精度 具有 显著 的 提升 作用 ,其 中 植被 指数 
特征 的 提升 作用 大 于 纹理 特征 。 

(3) 基于 对 象 进 行 准 踢 尔 山楂 识别 相 较 于 传统 
基于 像 元 的 方式 ,能 够 有 效 解决 “椒盐 现象 ”, 显著 
提高 识别 精度 .算法 运行 效率 和 和 鲁 棒 性 。 基 于 对 象 
进行 分 类 识别 将 算法 OA、UA 和 PA 分 别提 高 了 
2.86% 4.44% Fil 7.73% , Kappa 系数 提升 了 0.04, 而 运 
行 时 间 较 少 了 近 80%。 

(4) 权重 自 适 应 的 多 分 类 器 投票 组 合算 法 能 
综合 不 同 算法 的 优势 ,有 效 规避 单一 分 类 器 地 物 类 
型 表征 力 差 异 造成 的 部 分 " 混 消 ”, 提 高 识别 精度 。 
联合 2 种 分 类 器 的 WAVCC 算 法 相 较 于 单一 的 SVM 
和 RF 算法 识别 的 总 体 精度 和 Kappa 系数 分 别提 升 
T 1.81% 3.31% 和 0.16 .0.11。 
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Crataegus songarica recognition using Gaofen—6 wide-field-view 


data assisted by multiple features 
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Abstract: Our ability to extract spatial distribution information for Crataegus songarica by remote sensing is 
relatively weak, and the performance of a single algorithm in information extraction is different. To address this 
problem, we explored the application potential of domestic Gaofen—6 (GF-6) wide-field-view (WFV) data in tree 
species recognition in arid and semi-arid areas. Using GF-6 WFV and Ziyuan-3 (ZY—3) data, we constructed a 
combined classifier recognition algorithm with multi- feature assistance. First, we combined a linear spectral 
clustering algorithm for ZY—3 data super-pixel segmentation with the sample set to determine the optimal scale, 
avoid the salt- and- pepper phenomenon and improve the recognition accuracy. Second, we extracted spectral 
features, texture features, and vegetation index features based on multi-source data, using the recursive feature 
elimination method to select classification features. Feature importance was evaluated based on the mean 
decrease impurity to construct the optimal classification feature set, improve the separability between feature 
classes, and reduce the redundancy between features. Finally, we constructed a weight- adaptive voting 
combination classifier based on the support vector machine algorithm and random forest algorithm. Combined 
with a variety of classification schemes, the spatial distribution of Crataegus songarica was extracted and 
verified to evaluate the influence of object-oriented algorithm, multi-classifier combination algorithm, and feature 
selection on the classification accuracy. The results showed that GF- 6 WFV data can be used to identify 
Crataegus songarica and have great application potential in forestry production. Compared with GF-1 WFV, two 
new red- edge bands of GF- 6 WFV play an important role in the identification of Crataegus songarica. 
Compared with traditional pixel-based methods, the object-based recognition of Crataegus songarica effectively 
mitigated the pepper salt phenomenon and significantly improved the recognition accuracy, algorithm efficiency, 
and robustness. Moreover, the feature selection effectively reduced the redundancy between classification 
features and improved the computational efficiency and algorithm stability; the selected features significantly 
improved the accuracy. Using a weight-adaptive multi-classifier voting combination algorithm can integrate the 
advantages of different algorithms, effectively avoid the partial ‘confusion’ caused by the representation force 
difference of the single classifier, and improve the recognition accuracy. 


Keywords: GF-6; feature selection; object-oriented; multi classifier combination; Crataerus songarica 


